Análisis y expansión de consultas en lenguaje natural para mejora de la búsqueda en Web
نویسندگان
چکیده
1. Resumen El proceso tradicional de búsqueda en Web se encuentra limitado por los lenguajes de consulta y por la carencia de información semántica sobre el dominio al que se refiere el usuario. Esto provoca que el sistema no recupere todos los resultados relevantes y sí obtenga, por el contrario, resultados que nada tienen que ver con la consulta original. El proyecto MESIA (CAM 07T/0017/1998) intenta paliar esta situación en el servidor Web de la Comunidad Autónoma de Madrid (www.comadrid.es), actuando como interfaz entre el usuario y el buscador Altvista. 2. Objetivos El sistema MESIA facilita al usuario la comunicación con el motor de búsqueda, actuando como interfaz en dos niveles: antes de la búsqueda, recibe la consulta del usuario escrita en lenguaje natural y, posteriormente, la convierte en una consulta booleana. Durante este proceso se produce una expansión de la consulta mediante recursos lingüísticos que mejora sensiblemente los resultados. Después de la búsqueda, MESIA incorpora información sobre el dominio al proceso, permitiendo la expansión semántica de resultados: una vez identificado el tema de la consulta, a los resultados obtenidos se añaden enlaces sobre asuntos relacionados con dicho tema. Además, esta información sirve también para ordenar los resultados según su relevancia para la consulta. 3. Descripción del sistema La figura 1 describe la arquitectura del prototipo actual de MESIA (http://tornado.dia.fi.upm.es/mesia/mesia_demo .hml), que ha sido implementado en el entorno CIAO-Prolog [1]. A continuación se describen los dos módulos principales: el módulo de expansión de la consulta y el de ampliación y ordenación de resultados.
منابع مشابه
Sistema de Consultas en Lenguaje Natural para Bases de Datos
Este trabajo se plantea el desarrollo de un módulo de consulta en lenguaje natural (en forma escrita) a una base de datos relacional empleada en el sistema ITASS. Dicho módulo involucra los procesos propios de un sistema de consultas en lenguaje natural a bases de datos relacionales; análisis sintáctico, análisis semántico, análisis morfológico y la interpretación de la consulta a un lenguaje f...
متن کاملPrivacidad en Motores de Búsqueda con un Protocolo Multi-usuario con Atacantes Internos
Los motores de búsqueda son herramientas que permiten encontrar información en Internet. Sin embargo, pueden también representar una amenaza para la privacidad de sus usuarios, ya que almacenan y analizan la información personal que los usuarios revelan al hacer sus consultas. Para evitar este problema de seguridad, es necesario proporcionar mecanismos que protejan a los usuarios de los motores...
متن کاملRealizing Interoperability of E-Learning Repositories
Español) Tras la explosión del efecto Internet la Web ofrece una enorme cantidad de información. ¿ Significa esto que los usuarios pueden encontrar fácilmente y de manera efectiva la información que buscan? La respuesta es no. Por ejemplo, de acuerdo a recientes estudios los usuarios encuentran la información que buscan en tan sólo un 50% o menos de las veces (y dedican entre un 15% y un 35% de...
متن کاملPrimera aproximación de un sistema de recuperación de información booleano con expansión semántica de consultas
Resumen. En el presente trabajo se propone una aproximación que utiliza la expansión de consultas en un Sistema de Recuperación de Información Booleano (SRIB), con la finalidad de mejorar el nivel de precisión de un SRIB sin expansión. Las consultas están formadas por los conceptos y relaciones existentes en ontoloǵıas de dominio. El SRIB sin expansión y con expansión asocia a cada consulta la ...
متن کامل[Google: Searches, analyses and networking in the health care environment].
La enfermerı́a, como todas las disciplinas de las Ciencias de la Salud, se encuentra en constante cambio y requiere de un gran esfuerzo investigador y formativo por parte de sus profesionales para garantizar la mejor atención y los mejores cuidados. El acceso al mejor conocimiento cientı́fico disponible y las Tecnologı́as de la Información y Comunicación (TIC) juegan un papel fundamental en esta p...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- Procesamiento del Lenguaje Natural
دوره 27 شماره
صفحات -
تاریخ انتشار 2001